Optimización de ruido sin gradientes para la alineación de recompensas en modelos generativos <meta name=description content=Alineación de recompensas sin gradientes en modelos generativos. Optimización eficiente sin derivadas para IA.> 2026-05-13 · 2 min